智能论文笔记

Deep Audio Waveform Prior

Arnon Turetzky , Tzvi Michelson , Yossi Adi , Shmuel Peleg

分类：机器学习

2022-07-21

卷积神经网络包含强大的先验，用于产生自然的图像[1]。这些先验可以以无监督的方式启用图像降解，超级分辨率和灌输。以前尝试在音频中展示类似想法的尝试，即深度音频先验，（i）使用诸如谐波卷积之类的手挑选的体系结构，（ii）仅使用频谱输入工作，并且（iii）主要用于消除高斯噪声[2]。在这项工作中，我们表明，即使在使用原始波形时，现有的音频源分离的SOTA体系结构也包含深度先验。可以通过训练神经网络来发现深度先验，以产生单个损坏的信号，因为将白噪声作为输入。具有相关深度先验的网络可能会在损坏的信号收敛之前生成更清洁的信号版本。我们通过几种损坏证明了这种恢复效果：背景噪声，混响和信号中的差距（音频介绍）。

translated by 谷歌翻译

我们考虑以持续的错误警报率（CFAR）学习检测器的问题。基于经典模型的复合假设检验解决方案对不完美的模型敏感，并且通常在计算上昂贵。相比之下，数据驱动的机器学习通常更强大，并产生具有固定计算复杂性的分类器。在许多应用中，学到的探测器通常没有CFAR。为了缩小这一差距，我们引入了CFARNET，其中损失函数受到惩罚，以在任何零假设的情况下促进检测器的类似分布。在具有一般高斯噪声的线性模型的情况下，渐近分析表明，经典的广义似然比检验（GLRT）实际上是CFAR约束贝叶斯风险的最小化器。合成数据和实际超光谱图像的实验表明，CFARNET导致近CFAR检测器的精度与竞争对手相似。

translated by 谷歌翻译

我们考虑将机器学习用于假设检验，重点是目标检测。基于古典模型的解决方案依赖于比较似然。这些对不完美的模型敏感，通常在计算上昂贵。相比之下，数据驱动的机器学习通常更强大，并产生具有固定计算复杂性的分类器。学习的探测器通常具有较低的复杂性，但在许多应用中所需的不持续的错误警报率（CFAR）。为了缩小这一差距，我们建议在任何零假设方案下促进检测器的相似分布的损失函数添加术语。实验表明，我们的方法以与竞争对手相似的准确性导致接近CFAR探测器。

translated by 谷歌翻译